经典统计力学存在局限性，尤其是在低温时量子效应变得显著，这就需要引入量子角度的统计力学。本章将首先指出经典统计力学的若干失效之处，再基于量子理论构建量子版本的统计力学。

稀薄多原子分子气

本节首先考虑由$n$原子分子构成的、分子间无相互作用的稀薄气体。

其中每一个$n$原子分子的哈密顿量是：

$\mathcal H_1 = \sum_{i=1}^n \frac{\vec p_i^2}{2m} + \mathcal V(\vec q_1,\dotsm\vec q_n)$

其中$\mathcal V$包括了分子内$n$个原子间化学键的全部信息。在这里我们已经假设分子内的每个原子质量都是$m$；如果质量不同，可以对变量做重标度$\vec q_i \to \vec q_i\sqrt{m/m_i}$，$\vec p_i \to \vec p_i\sqrt{m_i/m}$来得到上面的形式。如果可以忽略分子间相互作用，稀薄气体配分函数就可以写为

$Z(T,V,N) = \frac{Z_1^N}{N!} = \frac{1}{N!}\left\{ \int\prod_{i=1}^n \frac{ {\rm d}^3\vec p_i{\rm d}^3\vec q_i}{h^3} \exp\left[ -\beta\sum_{i=1}^n \frac{\vec p_i^2}{2m} + \mathcal V(\vec q_1,\dotsm\vec q_n) \right] \right\}^N$

通常使原子结合为分子的化学键非常强（能量在电子伏量级），在典型的可及温度（远小于分子解离温度$\sim 10^4\ {\rm K}$）处，分子的形状稳定存在且仅有微小形变。下面考虑这些小形变对单粒子配分函数$Z_1$的贡献。

首先通过最小化化学键能$\mathcal V(\vec q_1,\dotsm\vec q_n)$找到分子平衡的形状$(\vec q_1^0,\vec q_2^0,\dots,\vec q_n^0)$，微小形变可以视作在此基础上的微扰$\vec q_i = \vec q_i^0 + \vec u_i$，化学键能展开为：

$\mathcal V = \mathcal V^0 + \frac12 \sum_{i,j=1}^n \sum_{\alpha,\beta=1}^3 \frac{\partial^2 \mathcal V}{\partial q_{i,\alpha}\partial q_{j,\beta}} u_{i,\alpha} u_{j,\beta} + \mathcal O(u^3)$

其中$\alpha,\beta$是空间矢量的分量指标；在平衡点附近的一阶导数为零，因此最低阶贡献是二阶导数$\partial^2\mathcal V/\partial q_{i,\alpha}\partial q_{j,\beta}$，且二阶导数矩阵是正定的（只有非负本征值）。

将二阶导数矩阵$\partial^2\mathcal V/\partial q_{i,\alpha}\partial q_{j,\beta}$对角化，得到$3n$个非负本征值$\{k_s\}$，分别对应于$3n$个振动简正模式的“劲度系数”。可以将独立变量从形变坐标$\{u_{i,\alpha}\}$换为简正模振幅$\{\widetilde u_s\}$，以及其共轭动量$\{\widetilde p_s = m \dot{\widetilde u}_s\}$，这一变量变换是幺正的，$\sum_i \vec p_i^2 = \sum_s \widetilde p_s^2$，得到形变的二阶水平的哈密顿量是

$\mathcal H_1 = \mathcal V^0 + \sum_{s=1}^{3n}\left[ \frac{1}{2m} \widetilde p_s^2 + \frac{k_s}{2} \widetilde u_s^2 \right]$

同时这一变量变换也是正则变换，保持相空间积分测度不变：$\prod_{i,\alpha}{\rm d}u_{i,\alpha}{\rm d}p_{i,\alpha} = \prod_s {\rm d}\widetilde u_s {\rm d}\widetilde p_s$。该哈密顿量的期望值就是每个分子的平均能量；根据能均分原理，每个自由度的二次项对应于$k_BT/2$的能量，于是

$\langle \mathcal H_1 \rangle = \mathcal V^0 + \frac{3n}{2} k_BT + \frac{\lambda}{2}k_B T$

上式中第一项是原子结合为分子的化学键能，在非化学反应的过程中不会释放，可视为常数；第二项代表分子整体运动时的能量，第三项代表分子中原子振动的能量，$\lambda$就是$3n$个振动简正模式中具有非零$k_s$的数量，也即二阶导数矩阵的非零本征值个数，从物理上来讲，这是因为只有具有非零有限大小劲度系数的简正模才可以存储势能。具体为零的$k_s$个数，可以通过势能$\mathcal V$的对称性分析得出：

平移对称性：由于$\mathcal V(\vec q_1+\vec c_1,\dotsm\vec q_n+\vec c_n) = \mathcal V(\vec q_1,\dotsm\vec q_n)$，其对应于有$3$个自由度的$k_{\rm trans}=0$；这在物理上是因为这种形式的简正模式对应于分子的整体平动，而这已经在动能项部分计算过一次，此在振动项不会储存额外的形变能量。
旋转对称性：某些形状的分子$\mathcal V(\vec q_1,\dotsm\vec q_n)$也具有特定方向的旋转不变性，其对应的自由度的$k_{\rm rot}=0$，这也解释为分子的整体旋转。但是具体为零的$k_{\rm rot}$的个数$r$取决于分子的形状，一般而言$0\leq r\leq 3$，例如单原子分子$r=0$，棒状分子$r=2$，一般形状的分子$r=3$。

最终得到$\lambda = 3n - 3 - r$，就是具有非零本征值的简正模个数，对应于法向振动模式。于是平均能量就是

$\langle \mathcal H_1 \rangle = \mathcal V^* + \frac{6n-3-r}{2}k_B T$

这给出经典理论预言的热容：

$C_V^{\rm cl.} = \frac{6n-3-r}{2}k_B \qquad C_P^{\rm cl.} = C_V^{\rm cl.} + k_B = \frac{6n-1-r}{2}k_B$

都是温度无关的，比值$\gamma = C_P/C_V$可以从绝热过程测量得到。假如上面的分析是正确的，那么一些典型分子的$\gamma$值应当是：

形状类型	例子	原子数$n$	转动自由度$r$	$\gamma$
单原子分子	$\rm He$	1	0	$5/3$
双原子分子	$\rm O_2$ or $\rm CO$	2	2	$9/7$
线性三原子分子	$\rm CO_2$	3	2	$15/13$
平面三原子分子	$\rm H_2O$	4	3	$14/12 = 7/6$
四原子分子	$\rm NH_3$	5	3	$20/18 = 10/9$

量子修正

上面是从经典理论出发得到的，我们期待实验上能看到一致的结果。但是对于稀薄气体热容的实验结果与前述结果并不一致。以定容热容为例，实验看到$C_V/k_B$值并非常数而是会随温度变化，例如双原子分子的热容只会在数千开尔文以上的高温才会测量到$C_V/k_B = 7/2$，而在室温则会降低到$5/2$，在更低温（$\sim 10\ {\rm K}$）则降低到$3/2$，如图所示。

低温时，双原子分子的热容接近于单原子分子的热容值，这意味着低温时，没有法向振动或整体转动的能量（经典的说法，这些自由度被冻结了）。

如果这些自由度的能量允许值是量子化的，那么低温时的能量不足以将这些自由度激发到第一激发态，或许可以解释实验现象。为此，我们考虑一个简单情况：双原子分子。并将其配分函数写为更清晰的形式：

$Z(T,N,V) = \frac{1}{N!}Z_1^N$

其中单个分子的配分函数是

$\begin{aligned} Z_1 &= \int \frac{ {\rm d}^3 q_1 {\rm d}^3 q_2 {\rm d}^3 p_1 {\rm d}^3 p_2}{h^6} \exp\left\{ -\beta\left[ \frac{\vec p_1^2}{2m} + \frac{\vec p_2^2}{2m} + \mathcal V(\vec q_1-\vec q_2) \right] \right\}\\ &= \int \frac{ {\rm d}^3 Q {\rm d}^3 P}{h^3} \exp\left[ -\beta\frac{\vec P^2}{2M}\right] \int \frac{ {\rm d}^3 q {\rm d}^3 p}{h^3} \exp\left[ -\beta\frac{\vec p^2}{2\mu} - \beta \mathcal V(\vec q) \right]\\ &= \int \frac{ {\rm d}^3 Q {\rm d}^3 P}{h^3} \exp\left[ -\beta\frac{\vec P^2}{2M}\right] \int \frac{ {\rm d}^2 \Omega {\rm d}^2 L}{h^2} \exp\left[ -\beta\frac{\vec L^2}{2I}\right] \int \frac{ {\rm d} u {\rm d} \pi}{h} \exp\left[ -\beta\frac{\pi^2}{2\mu} - \beta \left(\mathcal V(d_0) + \frac{\mu\omega^2}{2}u^2 \right) \right] \end{aligned}$

其中第二行将质心平动分离出来，$\vec Q = (\vec q_1 + \vec q_2)/2$是质心坐标，$\vec P$是与之对应的质心动量；$M$是总质量，$\mu$是约化质量。第三行将旋转模式和振动模式分离，$\vec \Omega$和$\vec L$是棒状双原子分子的两个转动自由度的角坐标及其角动量；$u$和$\pi$是在其轴方向上两个原子振动的相对位移和动量；$I$是转动惯量，$d_0$是势能最低时的距离，并将势能在平衡位置附近展开到二阶。于是将单分子配分函数拆分成了整体平动、整体转动、法向振动三个模式。

整体平动的讨论之前已经充分了，下面分别讨论振动和转动的模式。

法向振动模式

双原子分子具有一个法向振动模式，即在其轴向的振动，劲度系数$k = m\omega^2$。

我们首先在经典理论中计算该模式的能量，其经典配分函数是

$\begin{aligned} Z_{\rm vib}^{\rm cl.} &= \int \frac{ {\rm d}u{\rm d}\pi}{h} \exp\left[ -\beta\left( \frac{\pi^2}{2\mu} + \frac{\mu\omega^2}{2}u^2 \right) \right]\\ &=\frac{1}{h} \sqrt{ \frac{2\pi \mu}{\beta}\frac{2\pi}{\beta \mu \omega^2} }\\ &= \frac{2\pi}{h}\frac{1}{\beta \omega} \end{aligned}$

该模式储存的能量是

$\langle \mathcal H_{\rm vib} \rangle^{\rm cl.} = -\frac{\partial\ln Z}{\partial\beta} = \frac{1}{\beta} = k_B T$

来自于该模式的一个动能项和一个势能项分别提供的$k_BT/2$。

而在量子力学中，允许的能量仅仅是量子化的若干离散值

$\langle \mathcal H_{\rm vib} \rangle^{\rm qt.} = \hbar\omega\left( n+\frac12 \right) \qquad n = 0,1,2,\dots$

假设该量子系统处于任意一个允许的离散能级的概率都正比于其玻尔兹曼因子（这一点之后会论证），那么概率的归一化因子是

$Z_{\rm vib}^{\rm qt.} = \sum_{n=0}^\infty {\rm e}^{-\beta\hbar\omega(n+1/2)} = \frac{ {\rm e}^{-\beta\hbar\omega/2}}{1-{\rm e}^{-\beta\hbar\omega}}$

其高温极限

$\lim_{\beta\to 0} Z_{\rm vib}^{\rm qt.} = \frac{1}{\hbar\beta\omega}$

可见，只要我们将经典相空间的测度$h$与量子力学中的普朗克常数联系起来：$h/2\pi = \hbar$，那么量子归一化系数$Z_{\rm vib}^{\rm qt.}$的高温极限就是经典配分函数。

该法向振动模式能量的量子期望值是

$E_{\rm vib}^{\rm qt.} = \frac{1}{2}\hbar\omega + \hbar\omega \frac{ {\rm e}^{-\beta\hbar\omega}}{1-{\rm e}^{-\beta\hbar\omega}} = \frac{1}{2}\hbar\omega + \hbar\omega \frac{ {\rm e}^{-\beta\hbar\omega}}{1-{\rm e}^{-\beta\hbar\omega}} = E_0 + k_B \theta_{\rm vib} \frac{ {\rm e}^{ -\theta_{\rm vib}/T} }{ 1 - {\rm e}^{ -\theta_{\rm vib}/T} }$

其中第一项是来自零温真空的量子涨落，第二项描述了有限温度时的热涨落能量，$\theta_{\rm vib} = \hbar\omega/k_B$是振动特征温度。上式给出与温度相关的热容：

$C_V^{\rm qt.} = \frac{ {\rm d}E_{\rm vib}^{\rm qt.}}{\ {\rm d}T} = k_B \left( \frac{\hbar\omega}{k_B T} \right)^2 \frac{ {\rm e}^{-\beta\hbar\omega}}{(1-{\rm e}^{-\beta\hbar\omega})^2} = k_B \left( \frac{\theta_{\rm vib} }{T} \right)^2 \frac{ {\rm e}^{ -\theta_{\rm vib}/T} }{ (1 - {\rm e}^{ -\theta_{\rm vib}/T})^2 }$

可以看到：

在高温$T\gg\theta_{\rm vib}$时，热容会接近$k_b$；
在低温$T\ll\theta_{\rm vib}$时，热容会以指数$\sim \exp(-\theta_{\rm vib}/T)$衰减至接近$0$；

振动特征温度$\theta_{\rm vib} = \hbar\omega/k_B$与振动能级$\hbar\omega$相关，其典型值是$10^3 \sim 10^4\ {\rm K}$，这就解释了为什么经典热容只会在高温时才会与实验值一致。

整体转动模式

为解释双原子分子在低温时的热容，还需要研究转动自由度的量子化。

为写出转动模式哈密顿量，借助拉格朗日量比较方便，经典理论中，一个双原子分子的取向可以由两个角度参数$\theta$和$\phi$描述，其转动动能用拉格朗日量的形式写为

$\mathcal L_{\rm rot} = \frac{1}{2}I\dot{\vec\Omega}^2 = \frac{1}{2}I\left( \dot\theta^2 + \dot\phi^2\sin^2\theta \right)$

其共轭动量分别是

$p_\theta = I\dot\theta \qquad p_\phi = I \dot\phi \sin^2\theta$

哈密顿量就是

$\mathcal H_{\rm rot} = \frac{1}{2I}\left( p_\theta^2 + \frac{p_\phi^2}{\sin^2\theta} \right) \equiv \frac{\vec L^2}{2I}$

其中$L$是角动量。这给出经典配分函数

$\begin{aligned} Z_{\rm rot}^{\rm cl.} &= \frac{1}{h^2}\int_0^\pi{\rm d}\theta \int_0^{2\pi}{\rm d}\phi \int_{-\infty}^{+\infty}{\rm d}p_\theta {\rm d}p_\phi \exp\left[ -\frac{\beta}{2I}\left( p_\theta^2 + \frac{p_\phi^2}{\sin^2\theta} \right) \right]\\ &= \left(\frac{4\pi}{h^2}\right)^2 \frac{2 I}{\beta} \end{aligned}$

该模式存储能量为

$\langle \mathcal H_{\rm rot} \rangle^{\rm cl.} = -\frac{\partial\ln Z}{\partial\beta} = \frac{1}{\beta} = k_B T$

正如我们对于棒状分子所期待的那样，具有两个整体旋转自由度。

而在量子力学中，已经知道角动量只能取量子化的值：

$\vec L^2 = \hbar^2 \ell (\ell+1) \qquad \ell = 0,1,2,\dots$

并且每个值都有$2\ell+1$重简并，对应于角动量分量的取值：

$L_z = \hbar m_\ell \qquad m_\ell = -\ell,-\ell+1,\dots,\ell-1,\ell$

因此可以从这些取值中得到概率归一化因子：

$Z_{\rm rot}^{\rm qt.} = \sum_{\ell=0}^\infty \exp\left[ -\frac{\beta}{2I} \hbar^2 \ell (\ell+1) \right] (2\ell+1) = \sum_{\ell=0}^\infty \exp\left[ -\frac{\theta_{\rm rot}}{T}\ell(\ell+1) \right](2\ell+1)$

其中$\theta_{\rm rot} = \hbar^2/(2Ik_B)$是转动特征温度。上述求和一般来说难以解析计算出，但可以分析其在高温和低温时的极限行为：

在高温$T\gg\theta_{\rm rot}$时，上式中指数随$\ell$的变化非常缓慢，求和可以近似为积分：
$\begin{aligned} \lim_{\beta\to 0} Z_{\rm rot}^{\rm qt.} &= \int_{0}^\infty {\rm d}x\exp\left[ -\frac{\theta_{\rm rot}}{T}x(x+1) \right](2x+1)\\ &=\int_0^\infty{\rm d}y\exp\left[ -\frac{\theta_{\rm rot}y}{T} \right]\\ &=\frac{T}{\theta_{\rm rot}} = Z_{\rm rot}^{\rm cl.} \end{aligned}$
就得到经典的结果；
在低温$T\ll\theta_{\rm vib}$时，求和主要由前面几项主导，
$\lim_{\beta\to \infty} Z_{\rm rot}^{\rm qt.} = 1 + 3 {\rm e}^{-2\theta_{\rm rot}/T} + \mathcal O({\rm e}^{-6\theta_{\rm rot}/T})$
这给出能量是
$E_{\rm rot}^{\rm qt.} = 6 k_B \theta_{\rm rot} {\rm e}^{-2\theta_{\rm rot}/T} + \cdots$
热容
$C_{\rm rot}^{\rm qt.} = 3k_B\left( \frac{2\theta_{\rm rot}}{T} \right)^2 {\rm e}^{-2\theta_{\rm rot}/T} + \cdots$

综上，整体转动模式的热容随温度的变化如图

其行为与振动模式是类似的，会在低温时冻结。一般来说，转动特征温度$\theta_{\rm rot}$典型值是$1\sim10\ {\rm K}$，远低于振动特征温度的典型值。

因此，如果考虑量子的能级离散效应，就可以解释在实验上看到的气体热容随温度变化的现象：当温度很高时，平动、转动、振动自由度均被激发，此时的热容值接近于对自由度分析的结果；当温度下降时，首先会低于振动特征温度$\theta_{\rm vib}$，此后振动能级将会难以激发从而保持在基态，热容只剩平动和转动模式的贡献；温度进一步下降到转动特征温度$\theta_{\rm rot}$以下时，转动能级也难以激发，于是此时的热容仅剩分子整体平动的贡献，因此与单原子分子的热容接近。

在后面的量子统计将会看到，在更低温时，热容会进一步下降为零。

固体振动

本节开始引入分子间的相互作用。

粒子间的相互吸引势将会导致气体在低温时首先凝聚为液态，在更低温时进一步凝固为固态。固态时，分子几乎被完全束缚在一个确定的位置而不能进行平动或转动，仅可以在平衡位置附近以一定的频率做微小振动。

为讨论固体的热力学，可以将固体视为一个“大分子”，构成它的每个“原子”就是实际的物质分子，且整个固体“大分子”中的“原子数”$n$就是固体中的实际物质分子数$N$，即令$n=N\gg1$。并且我们暂时不考虑每个分子内部的结构和运动，将其视作单原子分子；同时我们也不会考虑整块固体的平动和转动，因此它的热容实际上几乎全部来自内部分子的振动，并且可以期待在极低温时由于振动自由度的“冻结”，固体热容将会降低到零。这样就可以直接利用上一节的结论来研究固体性质。具体来说：

通过最小化固体内部的分子间势能$\mathcal V$，来获得固体的经典基态构型。几乎所有情况下，最低能量条件都会让分子形成周期性排列的晶格。可以引入三个基矢$\hat a$，$\hat b$，$\hat c$来将一个简单晶体中的分子坐标表示为：

$\vec q^0(\ell,m,n) = \ell\hat a + m\hat b + n\hat c \equiv \vec r$

其中$\{(\ell,m,n)\}$是整数的三元组。

在有限温度时，分子可以在其平衡位置附近发生微小振动，

$\vec q_{\vec r} = \vec r + \vec u(\vec r)$

振动能量是

$\mathcal V = \mathcal V^0 + \frac12 \sum_{\vec r,\vec r'}^N \sum_{\alpha,\beta=1}^3 \frac{\partial^2 \mathcal V}{\partial q_{\vec r,\alpha}\partial q_{\vec r',\beta}} u_{\alpha}(\vec r) u_{\beta}(\vec r') + \mathcal O(u^3)$

寻找晶体振动的简正模式。由于晶格平移对称性的存在，简正模式的寻找将会大大简化，具体来说：二阶导数矩阵将仅依赖于两点之间相对距离：

$\frac{\partial^2 \mathcal V}{\partial q_{\vec r,\alpha}\partial q_{\vec r',\beta}} = K_{\alpha\beta}(\vec r-\vec r')$

且$K(\vec r-\vec r’) = K(\vec r’-\vec r)$。根据这一性质，总可以将二阶导数矩阵分块对角化。这要利用傅立叶变换

$u_\alpha(\vec r) = \sum_{\vec k}^{'}\frac{ {\rm e}^{ {\rm i}\vec k\cdot\vec r}}{\sqrt N}\widetilde u_\alpha(\vec k)$

由$\vec k$和$\alpha$指标确定的一种特定的晶体振动简正模式，在物理上对应于固体中传播的声波。其中$\vec k$是声波的波矢，大小是波长的倒数$k = 2\pi/\lambda$；指标$\alpha$对应于声波的极化，三个独立的极化包括1个纵向极化和2个横向极化。

晶格中有意义的波矢长度应当存在一个上限$|\vec k| < k_{\rm max}$，例如对于简单正方晶格$k < k_{\rm max} = \pi/a$，其中$a$是格点之间的最短格距；超过这个大小的波矢对应于波长$\lambda<2a$，这是没有意义的。这个$\vec k$的区域称为（第一）布里渊区。上面傅立叶变换中上标$’$表示在布里渊区内对波矢求和。

利用傅立叶变换，将振动能量表示为

$\mathcal V = \mathcal V^0 + \frac{1}{2N} \sum_{\vec k,\vec k'}^{'} \sum_{\vec r,\vec r'}^N \sum_{\alpha,\beta=1}^3 K_{\alpha\beta}(\vec r-\vec r') {\rm e}^{ {\rm i}\vec k\cdot\vec r} u_{\alpha}(\vec r) {\rm e}^{ {\rm i}\vec k\cdot\vec r} u_{\beta}(\vec r)$

将每一对在$K_{\alpha\beta}$中成对出现的坐标重新表示为相对它们中心的相对坐标：

$\vec r = \vec R + \frac{\vec \rho}{2} \qquad \vec r' = \vec R - \frac{\vec \rho}{2}$

则

$\begin{aligned} \mathcal V &= \mathcal V^0 + \frac{1}{2N} \sum_{\vec k,\vec k'}^{'} \sum_{\alpha,\beta=1}^3 \left( \sum_{\vec R} {\rm e}^{ {\rm i}(\vec k + \vec k')\cdot\vec R} \right) \left( \sum_{\vec \rho} K_{\alpha\beta}(\vec \rho) {\rm e}^{ {\rm i}(\vec k-\vec k')\cdot\vec \rho/2} \widetilde u_{\alpha}(\vec k) \widetilde u_{\beta}(\vec k') \right) \\ &= \mathcal V^0 + \frac12 \sum_{\vec k,\alpha,\beta}^{'} \left[ \sum_{\vec \rho} K_{\alpha\beta}(\vec \rho) {\rm e}^{ {\rm i}\vec k\cdot\vec \rho} \right] \widetilde u_{\alpha}(\vec k)\widetilde u_{\beta}(-\vec k) \\ &= \mathcal V^0 + \frac12 \sum_{\vec k,\alpha,\beta}^{'} \widetilde K_{\alpha\beta}(\vec k)\widetilde u_{\alpha}(\vec k)\widetilde u^*_{\beta}(\vec k) \end{aligned}$

因此，波矢$\vec k$不同的傅立叶模就在二次项中解耦，原本$3N\times 3N$的二阶导数矩阵被分块对角化为了若干具有不同波矢$\vec k$的$3\times3$矩阵$\widetilde K_{\alpha\beta}(\vec k)$，而它的具体形式又进一步受到晶格点群对称性的限制。

简单起见，可以考虑最简单的一种情况即各向同性材料，此时$\widetilde K_{\alpha\beta}(\vec k) = \delta_{\alpha\beta}\widetilde K(\vec k)$也是对角化的，并且是常数矩阵。这就确定了晶体振动的简正模式，描述其形变的经典哈密顿量写为

$\mathcal H^{\rm cl.} = \mathcal V^0 + \sum_{\vec k,\alpha}^{'} \left[ \frac{1}{2m} \left|\widetilde p_\alpha(\vec k)\right|^2 + \frac{\widetilde K(\vec k)}{2} \left|\widetilde u_\alpha(\vec k)\right|^2 \right]$

这描述了$3N$个独立的简谐振子，每个的角频率是$\omega_\alpha(\vec k) = \sqrt{\widetilde K(\vec k)/m}$。

在经典统计力学观点来看，每个具有非零劲度系数的简正模分别提供$k_BT$的能量（两个二次项），而其中最多有$6$个简正模（分别对应固体的整体平动和转动）可能具有零劲度系数，因此上面的哈密顿量会给出与振动相关的内能的经典结果是$3Nk_BT$，至多相差$1/N$的非广延修正。这会给出与温度无关的热容，而再次与实验结果不同：实验上会看到热容在低温时消失。

与上一节类似，必须要考虑量子效应。固体晶格振动的简正模式（声波）对应的量子化激发被称为声子。将上面哈密顿量中每个简谐振子都量子化，得到：

$\mathcal H^{\rm qt.} = \mathcal V^0 + \sum_{\vec k,\alpha}^{'} \hbar\omega_\alpha(\vec k) \left( n_\alpha(\vec k) + \frac12 \right)$

其中整数组$\{n_{\vec k,\alpha}\}$描述了固体的微观量子态。各个简谐振子都是相互独立的，于是

$Z^{\rm qt.} = \sum_{\{n_{\vec k,\alpha}\}} {\rm e}^{-{\beta\mathcal H^{\rm qt.}}} = {\rm e}^{-\beta E_0} \prod_{\vec k,\alpha}^{'} \sum_{n_{\vec k,\alpha}} {\rm e}^{-\beta\hbar\omega_\alpha(\vec k)(n_{\vec k,\alpha}+1/2)} = {\rm e}^{-\beta E_0}\prod_{\vec k,\alpha}^{'} \frac{ {\rm e}^{-\beta\hbar\omega_\alpha(\vec k)/2}}{1-{\rm e}^{-\beta\hbar\omega_\alpha(\vec k)}}$

可见，它就是在上一节得到的单个简谐振子的因子$Z_{\rm vib}^{\rm qt.}$的乘积。内能是

$E^{\rm qt.} = E_0 + \sum_{\vec k,\alpha}^{'} \frac{\hbar\omega_\alpha(\vec k)}{2} + \sum_{\vec k,\alpha}^{'} \hbar\omega_\alpha(\vec k) \left\langle n_\alpha(\vec k) \right\rangle = E_0^* + \sum_{\vec k,\alpha}^{'} \hbar\omega_\alpha(\vec k) \left\langle n_\alpha(\vec k) \right\rangle$

其中$E_0^$除了$\mathcal V^$对应的能量，还包括所有简谐振子的基态能量；$\left\langle n_\alpha(\vec k) \right\rangle$是平均占据数，由下面给出

$\begin{aligned} \left\langle n_\alpha(\vec k) \right\rangle &= \frac{\sum_{n=0}^\infty n {\rm e}^{-\beta\hbar\omega_\alpha(\vec k)n}}{\sum_{n=0}^\infty {\rm e}^{-\beta\hbar\omega_\alpha(\vec k)n}}\\ &= - \frac{\partial}{\partial (\beta\hbar\omega_\alpha(\vec k))}\ln\frac{1}{1-{\rm e}^{-\beta\hbar\omega_\alpha(\vec k)}}\\ &= \frac{ {\rm e}^{-\beta\hbar\omega_\alpha(\vec k)}}{1-{\rm e}^{-\beta\hbar\omega_\alpha(\vec k)}}\\ &= \frac{1}{ {\rm e}^{ \beta\hbar\omega_\alpha(\vec k)}-1} \end{aligned}$

从而内能是

$E^{\rm qt.} = E_0^* + \sum_{\vec k,\alpha}^{'} \frac{\hbar\omega_\alpha(\vec k)}{ {\rm e}^{ \beta\hbar\omega_\alpha(\vec k)}-1}$

下面的讨论将基于这个式子。

爱因斯坦模型

作为首次考虑量子力学效应的尝试，我们可以采用爱因斯坦模型，假设所有的简谐振子都具有相同的角频率$\omega_E$。这一模型描述的是大量由相同劲度系数$K = m\omega^2$的弹簧所固定在平衡位置附近的粒子。内能的结果是

$E = E_0^* + 3N \frac{\hbar\omega_E}{ {\rm e}^{ \beta\hbar\omega_E}-1} = E_0^* + 3N \hbar\omega_E \frac{ {\rm e}^{ -\beta\hbar\omega_E} }{ 1 - {\rm e}^{ -\beta\hbar\omega_E} } = E_0^* + 3N k_B \theta_E \frac{ {\rm e}^{ -\theta_E/T} }{ 1 - {\rm e}^{ -\theta_E/T} }$

热容

$C = \frac{ {\rm d}E}{ {\rm d}T} = 3Nk_B \left( \frac{\theta_E}{T} \right)^2 \frac{ {\rm e}^{ -\theta_E/T} }{ (1 - {\rm e}^{ -\theta_E/T})^2 }$

它们都以$3N$正比于上一节得到的单个简谐振子的结果；其中特征温度

$\theta_E = \frac{\hbar\omega_E}{k_B}$

称为爱因斯坦温度。特别地，当极低温时，上式预言热容将会以指数$\sim\exp(-\theta_E/T)$衰减至零。

实验观察到极低温时热容的确会衰减到零，但是其衰减行为是更以缓慢的$\sim T^3$的形式而非指数形式，这说明爱因斯坦模型的假设——即所有简谐振子的频率相同——过于粗糙。

德拜模型

为解决这一差异，可以转而采用德拜模型，它强调在低温时，对热容的主要贡献仅来自于最低频率的简谐振子，因为它们最容易被激发。

低能的模式对应于小的波矢$k = |\vec k|$或长的波长$\lambda = 2\pi/k$；其极限情况是$k = 0$或$\lambda\to\infty$，描述的是晶格的整体平移，这不是振动的简正模式因而对应于零本征值，$\widetilde K(\vec k=\vec 0)=0$。我们希望$\lim_{k\to 0}\widetilde K(\vec k) = \widetilde K(\vec 0) = 0$，于是在小波矢附近有如下展开

$\widetilde K(\vec k) = B k^2 + \mathcal O(k^4)$

式中没有奇数阶项，因为$K(\vec r-\vec r’) = K(\vec r’-\vec r)$给出$\widetilde K(\vec k) = \widetilde K(-\vec k)$。其对应的频率

$\omega(\vec k) \approx \sqrt{\frac{Bk^2}{m}} = vk$

上面频率和波矢的关系称为色散关系。上式表明，在低频时，色散关系近似是线性的。其中$v = \sqrt{B/m}$是晶体中的声速；在各向同性介质中，不同极化$\alpha$的声波具有相同的速度。如果一般各向异性的晶体，不满足$\widetilde K_{\alpha\beta}(\vec k) = \delta_{\alpha\beta}\widetilde K(\vec k)$的假设，那么声波的不同极化也具有不同的速度，色散关系可能有多个分支，但它们在低频区都应当分别是线性的。

在低温时，内能主要来自低能声子的贡献，利用色散关系可以写为：

$E^{\rm qt.} = E_0^* + \sum_{\vec k,\alpha}^{'} \frac{\hbar vk}{ {\rm e}^{ \beta\hbar vk}-1}$

对布里渊区中全部可能的波矢$\vec k$和极化$\alpha$求和。考虑如何做上式的求和，就需要考察$\vec k$在动量空间的分布。假设在箱$V = L_x \times L_y \times L_z$设置周期性边界条件，允许的波矢只有

$\vec k = \left( \frac{2\pi n_x}{L_x} , \frac{2\pi n_y}{L_y} , \frac{2\pi n_z}{L_z} \right)$

其中$\{n_x,n_y,n_z\}$都是整数。在箱体积$V\to\infty$极限下，用态密度$\rho$表示单位体积${\rm d}\vec k$内的允许模式数：

${\rm d}\mathcal N = \frac{ {\rm d}k_x}{2\pi/L_x} \frac{ {\rm d}k_y}{2\pi/L_y} \frac{ {\rm d}k_z}{2\pi/L_z} = \frac{V}{(2\pi)^3}{\rm d}^3\vec k \equiv \rho {\rm d}^3\vec k$

于是就可以将求和替换为积分：

$\lim_{V\to\infty} \sum_{\vec k}f(\vec k) = \int{\rm d}^3\vec k \rho f(\vec k)$

于是能量就是

$E = E_0^* + 3V \int_{\rm B.Z.} \frac{ {\rm d}^3k}{(2\pi)^3} \frac{\hbar vk}{ {\rm e}^{ \beta\hbar vk}-1}$

上式中的积分是对整个布里渊区进行，结果依赖于布里渊区的形状，因而不可能给出一个能量的简单表达式。但是，可以考察它的高温和低温极限。两个极限由德拜温度决定：

$\theta_D = \frac{\hbar v k_{\rm max}}{k_B} \approx \frac{\hbar v}{k_B}\frac{\pi}{a}$

当$T\gg \theta_D$，所有模式的行为都与经典相同。上式中被积函数近似为$k_BT$；由于总模式数就是$3N = 3V\int_{\rm B.Z.}{\rm d}^3k/(2\pi)^3$，因此能量得到与经典一致的结果：
$\lim_{T\gg\theta_D}E = E_0^* + 3Nk_BT$ $\lim_{T\gg\theta_D}C = 3Nk_BT$
当$T\ll \theta_D$，由于被积函数中的因子${\rm e}^{ \beta\hbar vk}$在布里渊区边界处最大，而在小$k$处很小，因此整个被积函数的主要贡献几乎全部来自小$k$处，并且可以将积分区域推广至无穷区域而仅带来很小的误差。此时积分近似为：
$\begin{aligned} \lim_{T\ll\theta_D}E &\approx E_0^* + \frac{3V}{8\pi^3} \left( \frac{k_BT}{\hbar v} \right)^3 4\pi k_BT \int_0^\infty{\rm d}x\frac{x^3}{ {\rm e}^x - 1}\\ &= E_0^* + \frac{\pi^2}{10}V \left( \frac{k_BT}{\hbar v} \right)^3 k_B T\\ &= E_0^* + \frac{\pi^2}{10}V k_BT [k^*(T)]^3 \end{aligned}$ $\lim_{T\ll\theta_D}C = \frac{2\pi^2}{5}Vk_B\left( \frac{k_BT}{\hbar v} \right)^3 = \frac{2\pi^2}{5}Vk_B [k^*(T)]^3$
其中
$k^*(T) = \frac{k_B T}{\hbar v}$
是温度$T$时的特征频率，也即此时可以被激发模式的最大频率。

可见，德拜模型预言在高温时热容与经典结果一致，而在低温时热容具有$C \propto Nk_B(T/\theta_D)^3$的行为，这符合实验结果。这一行为的物理解释是：当$T\ll\theta_D$时，仅有$\hbar\omega \simeq \hbar v k < k_BT$的低频声子可以被热激发，其波矢大小$|\vec k| < (k_B T/\hbar v)$；在$d$维空间体积为$V$的区域中这样的模式数约为$V(k_B T/\hbar v)^d$。每个被激发的模式被视为经典谐振子，提供约$k_BT$的能量，因此内能$E\sim Vk_BT(k_B T/\hbar v)^d$，内能$C\sim Vk_B(k_B T/\hbar v)^d$，因此以$\sim T^d$形式降至零。

黑体辐射

上一节讨论的是固体介质的振动，其简正模式的激发对应于所谓“声子”；在气体或液体中，简正振动也对应于声音模式，于是对于振动模式的统计力学描述，本质上是对声子的统计。而即便是空的“真空”，其中也可以存在一种“振动”——电磁场的振荡，即电磁波。

考虑被局限在确定体积$V = L^3$箱中的电磁场，其简正模式——电磁波也可以在有限温度下被激发，这样的激发同样可以由波矢$\vec k$和极化$\alpha$来描述，只不过电磁波极化只有两个独立的横向极化，而没有纵向极化。在合适的坐标系下，电磁场的哈密顿量可以写为：

$\mathcal H^{\rm cl.} = \frac12 \sum_{\vec k,\alpha} \left[ \left|\widetilde p_\alpha(\vec k)\right|^2 + \omega_\alpha^2(\vec k) \left|\widetilde u_\alpha(\vec k)\right|^2 \right]$

其中光子的色散关系是简单的线性关系$\omega_\alpha(\vec k) = ck$，$c$是真空光速。

上面哈密顿量的形式与前一节中的形式非常相似，但是与之不同的是，电磁波的波矢$\vec k$没有布里渊区的限制，因此周期性边界条件下$\vec k = 2\pi(n_x,n_y,n_z)/L$中的整数$n_x,n_y,n_z$可以任意大。如果直接类比上一节的处理方法，这会导致紫外灾难：每个模式分配$k_BT$的能量，但没有高频限制导致高频模式数无穷多，相应的能量也无穷大（低频实际上也存在相应的能量发散，称为红外灾难，但是被有限体积箱截断了）。

光子气的能量与压强

普朗克提出电磁场的能量量子化假设，电磁场的量子化激发被称为光子，解决了这一疑难。光子能量是

$\mathcal H^{\rm qt.} = \sum_{\vec k,\alpha} \hbar c k \left( n_{\vec k,\alpha} + \frac12 \right)$

与声子类似，归一化系数

$Z^{\rm qt.} = \sum_{\{n_{\vec k,\alpha}\}} {\rm e}^{-{\beta\mathcal H^{\rm qt.}}} = \prod_{\vec k,\alpha} \sum_{n_{\vec k,\alpha}} {\rm e}^{-\beta\hbar c k(n_{\vec k,\alpha}+1/2)} = \prod_{\vec k,\alpha}^{'} \frac{ {\rm e}^{-\beta\hbar c k/2}}{1-{\rm e}^{-\beta\hbar c k}}$

光子气的内能是

$E^{\rm qt.} = V E_0 + \sum_{\vec k,\alpha} \frac{\hbar c k}{ {\rm e}^{ \beta\hbar c k}-1} = V E_0 + \frac{2V}{(2\pi)^3}\int {\rm d}^3 k \frac{\hbar c k}{ {\rm e}^{ \beta\hbar c k}-1}$

其中真空零点能$E_0$实际上是发散的，但由于能量只有相对值才有意义，因此可以被忽略。于是有效能量密度是

$\frac{E}{V} = \frac{\hbar c}{\pi^2} \left(\frac{k_BT}{\hbar c}\right)^4 \int_0^\infty {\rm d}x \frac{x^3}{ {\rm e}^x - 1} = \frac{\pi^2}{15} \left(\frac{k_BT}{\hbar c}\right)^4 k_BT$

另一方面，光子对箱壁也产生压强——光压。根据$Z^{\rm qt.}$，若将之视作正则配分函数则可得到自由能

$F = -k_BT\ln Z^{\rm qt.} = 2V \int \frac{ {\rm d}^3 k}{(2\pi)^3} \left[ \frac{\hbar c k}{2} + k_BT \ln (1-{\rm e}^{-\beta\hbar c k}) \right]$

利用分部积分，可得压强

$\begin{aligned} P &= -\left.\frac{\partial F}{\partial V} \right|_T\\ &= -\int \frac{ {\rm d}^3 k}{(2\pi)^3} \left[ \hbar c k + 2 k_BT \ln (1-{\rm e}^{-\beta\hbar c k}) \right]\\ &= P_0 - \frac{k_BT}{\pi^2}\int_0^\infty {\rm d}k\ k^2 \ln(1-{\rm e}^{-\beta\hbar c k})\\ &= P_0 + \frac{k_BT}{\pi^2}\int_0^\infty {\rm d}k \frac{k^3}{3}\frac{\beta\hbar c {\rm e}^{-\beta\hbar c k}}{1-{\rm e}^{-\beta\hbar c k}}\\ &= P_0 + \frac13 \frac{E}{V} \end{aligned}$

这里也存在零点压强$P_0 = \hbar c \int\widetilde{ {\rm d}k} k$，但它不能忽略，具有可观测的物理效应——卡西米尔效应。除了这一项外，压强以一个$1/3$的因子正比于能量密度，这接近相对论性气体的压强量级。

黑体辐射

继续类比粒子气体，若在箱壁上开一个小孔，那么箱内单位时间通过孔洞单位面积流失的能量是

$\phi = \langle c_\perp \rangle \frac{E}{V}$

所有光子速度大小都是$c$，于是其垂直分量的期望是

$\langle c_\perp \rangle = c \frac{1}{4\pi} \int_0^{\pi/2} 2\pi \sin\theta \cos\theta {\rm d}\theta = \frac{c}{4}$

于是

$\phi = \frac{c}{4}\frac{E}{V} = \frac{\pi^2}{60}\frac{k_B^4 T^4}{\hbar^3 c^2} = \sigma T^4$

这正是黑体辐射的斯特藩-玻尔兹曼定律，与实验结果一致。斯特藩常数是：$\sigma = \pi^2 k_B^4/60\hbar^3 c^2\approx 5.67\times 10^{-8}\ {\rm W m^{-2}K^{-4}}$。

现在就可以考察黑体辐射关于频率的分布，令$E(T)/V = \int{\rm d}k \mathcal E(k,T)$，那么

$\mathcal E(k,T) = \frac{\hbar c}{\pi^2} \frac{k^3}{ {\rm e}^{ \beta\hbar c k} - 1}$

于是在$[k,k+{\rm d}k]$之间的辐射通量就是$I(k,T){\rm d}k$，其中

$I(k,T) = \frac{c}{4}\mathcal E(k,T) = \frac{\hbar c^2}{4\pi^2}\frac{k^3}{ {\rm e}^{ \beta\hbar c k} - 1} = \begin{dcases} \frac{c}{4\pi}k^2k_BT &{\rm for\ }k\ll k^*(T) = \frac{k_BT}{\hbar c}\\ \frac{\hbar c^2}{4\pi^2}k^3 {\rm e}^{-\beta\hbar c k} &{\rm for\ }k\gg k^*(T) = \frac{k_BT}{\hbar c} \end{dcases}$

可以看到，无论是高频还是低频区段，辐射通量都显著下降，具体来说：低频区段表现得与经典行为接近，因为低频模式远低于特征频率，可以被自由激发。而高频区段显著受到量子效应的影响，能量的量子化导致提供了一个黑体辐射能量的上限截断，以避免了紫外灾难。

量子微观态

在前面几节中，我们已经指出了经典统计力学的几个失效之处，并且看到如果引入能级量子化的假设就可以解释实验现象，并且看到了量子概率归一化系数$Z^{\rm qt.}$与经典统计配分函数之间紧密的对应关系。这暗示我们可以类比于经典统计力学，而建立一个量子的统计力学，其束缚态的微观状态由离散化能级描述，并且不同态之间概率分布的相对权重与玻尔兹曼因子一致。

这种类比是需要被证明的。此外，量子力学本身天然还存在需要由概率性方式描述的不确定性，这与统计力学意义上的概率是本质不同的两种现象，因此在量子统计力学中，必须明确区分两种概率性的来源。

态的描述

经典多粒子系统的微观态，由$6N$维相空间$\Gamma$中的一个点$\{\vec q_i,\vec p_i|i = 1,2,\dots,N\}$描述；

量子多粒子系统的微观态，由复数域$\mathbb C$上的希尔伯特空间$H$（可以是无限维）中的一个归一化矢量$\ket\psi$所描述，因此即便描述同一个系统，量子态空间通常也比经典态空间大得多。

态矢$\ket\psi$满足线性叠加原理，并且可以在适当的完备正交归一基$\{\ket e\}$中唯一确定地展开：

$\ket\psi = \sum_e \bra{e} \ket{\psi} \ket{e}$

其中$\braket{e}{\psi} = \braket{\psi}{e}^$是两个矢量的内积，是一个复数；若将$e$视为变量，则$\braket{e}{\psi}$称为$\{\ket e\}$表象下的“*波函数”；例如坐标表象是$\ket {e} = \ket{(\vec q_i,\dots,\vec q_N) }$，那么

$\psi(\vec q_1,\dots,\vec q_N) = \braket{(\vec q_i,\dots,\vec q_N)}{\psi}$

在量子力学中，该波函数的物理诠释是：对态$\ket\psi$进行观测时，测量到其中$N$个粒子分别处于$\vec q_1,\dots,\vec q_N$位置的量子概率是$|\psi(\vec q_1,\dots,\vec q_N)|^2$。

量子态的归一化条件是

$\braket{\psi} = \sum_e \braket{\psi}{e}\braket{e}{\psi} = \sum_e |\braket{e}{\psi}|^2 = 1$

例如，在$d$维空间中的前述多粒子波函数的归一化条件要求

$\braket{\psi} = \int\prod_{i=1}^N {\rm d}^d\vec q_i |\psi(\vec q_1,\dots,\vec q_N)|^2 = 1$

可观测量的描述

经典理论可观测量是相空间上的实数值函数$\mathcal O(\{\vec q_i,\vec p_i\})$，每个点具有确定的可观测量数值；

量子理论可观测量是希尔伯特空间上的厄米算符$\hat {\mathcal O}$。特别地，哈密顿力学中同一个粒子的一组正则变量$p$、$q$的泊松括号满足$\{q_\alpha,p_\beta\} = \delta_{\alpha\beta}$，在量子力学中它们的对易子满足正则对易关系：

$[\hat q_\alpha,\hat p_\beta] = \hat q_\alpha \hat p_\beta - \hat p_\beta \hat q_\alpha = {\rm i}\hbar \delta_{\alpha\beta}$

其余对易子和不同粒子正则变量的对易子均为零。

对于具有经典对应的量子可观测量，其算符$\hat{\mathcal O}$可以直接在经典表达式$\mathcal O(\{\vec q_i,\vec p_i\})$中将正则变量作对称化（例如，乘积$pq \to (pq + qp)/2$），再替换为算符$\hat q_i$、$\hat p_j$，即可得到。

特别地，在坐标表象下，

$\hat q_i = q_i \ ;\quad \hat p_j = -{\rm i}\hbar \frac{\partial}{\partial q_j}$

算符在一组完备正交基$\{\ket{e}\}$中，可以表示为矩阵的形式：

$\hat{\mathcal O} = \sum_{e,\ell}\ket{e}\bra{e}\hat{\mathcal O}\ket{\ell}\bra{\ell} = \sum_{e,\ell} \mathcal O_{e\ell}\ket{e}\bra{\ell}$

其中$\mathcal O_{e\ell} = \bra{e}\hat{\mathcal O}\ket{\ell}$称为算符的矩阵元。

可观测量的值

经典力学中，特定经典微观态$\{\vec q_i,\vec p_i\}$上，某可观测量$\mathcal O$的值由函数$\mathcal O(\{\vec q_i,\vec p_i\})$唯一确定；

量子力学中，特定量子微观态$\ket\psi$上，某可观测量$\mathcal O$的值不被唯一确定，而是一个随机变量，它的取值来自于算符$\hat{\mathcal O}$的本征值：

$\hat{\mathcal O} \ket{\lambda} = o_\lambda \ket{\lambda}$

其中厄米算符的本征值$o_\lambda$一定是实数，也就是实验上可能测量到的值；相应的$\ket{\lambda}$称为属于本征值$o_\lambda$的本征态；属于不同本征值的本征态相互正交。一个厄米算符可以具有多个不同的本征值$\{o_\lambda\}$，并且厄米算符总存在一组本征态，可以构成希尔伯特空间的一组完备正交基，并且在该基下算符是对角化的：

$\hat{\mathcal O} = \sum_\lambda \mathcal O_{\lambda} \ket{\lambda}\bra{\lambda}$

对可观测量$\mathcal O$进行观测时，将会随机以一定的概率测量到其算符$\hat{\mathcal O}$的某一个本征值$o_\lambda$，测得此值的概率是

$P(o_\lambda) = |\braket{\lambda}{\psi}|^2$

若态$\ket\psi$或本征态$\ket{\lambda}$未归一化，则上述概率还应除以它们的模长。

在态$\ket\psi$中，算符测量值的期望是

$\langle \mathcal O \rangle = \bra{\psi} \hat{\mathcal O} \ket{\psi} = \sum_{\lambda,\rho}\braket{\psi}{\lambda}\bra{\lambda} \hat{\mathcal O} \ket{\rho}\braket{\rho}{\psi} = \sum_{\lambda,\rho} \mathcal O_{\lambda,\rho} \braket{\psi}{\lambda} \braket{\rho}{\psi}$

例如，多粒子态的势能和动能分别是

$\langle U(\{\vec q\}) \rangle = \int\prod_{i=1}^N \psi^*(\vec q_1,\dots,\vec q_N) U(\{\vec q\}) \psi(\vec q_1,\dots,\vec q_N)$ $\langle K(\{\vec q\}) \rangle = \int\prod_{i=1}^N \psi^*(\vec q_1,\dots,\vec q_N) K\left(\left\{-{\rm i}\hbar \frac{\partial}{\partial q}\right\}\right) \psi(\vec q_1,\dots,\vec q_N)$

态的时间演化

经典力学中，态的时间演化由哈密顿量$\mathcal H$所决定的哈密顿正则方程确定；

量子力学中，态的时间演化由哈密顿量算符$\hat{\mathcal H}$所决定的薛定谔方程确定：

${\rm i}\hbar\frac{\partial}{\partial t}\ket{\psi(t)} = \hat{\mathcal H}(t) \ket{\psi(t)}$

通常考虑不显含时的哈密顿量$\mathcal H(t) = \mathcal H$。为求解该方程，一个方便的做法是采取将$\mathcal H$对角化的基，即其本征态——能量本征态$\ket{n}$构成的完备正交基：

$\hat{\mathcal H} \ket{n} = \mathcal E_n \ket{n}$

其中$\mathcal E_n$是相应的能量本征值。能量本征态具有好的时间演化性质：

${\rm i}\hbar\frac{\partial}{\partial t}\ket{n(t)} = \hat{\mathcal H} \ket{n(t)} = \mathcal E_n \ket{n(t)} \quad\Longrightarrow\quad \ket{n(t)} = {\rm e}^{-{\rm i}\mathcal E_n (t-t_0)/\hbar} \ket{n(t_0)}$

即能量本征态的时间演化仅仅是附加一个相位，而这在物理上描述与原矢量相同的物理态，即能量本征态不会随时间演化。因此若将任意态按照能量本征态展开，那么它的时间演化就是：

$\ket{\psi} = \sum_n \braket{n}{\psi}\ket{n} \quad\Longrightarrow\quad \ket{\psi(t)} = \sum_{n }{\rm e}^{-{\rm i}\mathcal E_n (t-t_0)/\hbar} \braket{n}{\psi(t_0)}\ket{n}$

可以用一个幺正算符：时间演化算符来联系两个时刻的态矢量

$\ket{\psi(t)} = U(t,t_0)\ket{\psi(t_0)}$

它也满足薛定谔方程${\rm i}\hbar\partial_t U(t,t_0) = \hat{\mathcal H} U(t,t_0)$，以及边界条件$U(t_0,t_0) = 1$。如果哈密顿算符不含时，可以将时间演化算符显式写为

$U(t,t_0) = \exp\left[ -\frac{\rm i}{\hbar}\hat{\mathcal H}(t-t_0) \right]$

量子宏观态

与经典统计力学一致，量子统计中也可以利用大量$\mathcal N$微观态$\mu_\alpha$构造系综。在量子力学中，如果我们确定知道一个系统所处的微观态，则称其处于一个纯态；若不能确定它的微观态，但只知道它可能处于若干态上的经典概率，则称其处于一个混态。可见，混态的概念与统计力学中的系综是类似的。并且在混态中，记微观态$\mu_\alpha$出现的概率是$p_\alpha$。

量子统计力学中的宏观态，仍然是仅依赖于少数热力学函数（例如温度，压强……）的状态。一般而言，任何宏观态都处于混态，我们只能概率性地知道它可能处于某些微观态，而无法唯一确定是哪一个微观态。

密度算符

如何描述一个不确切知道其所处微观态的量子宏观态？经典系综中的相空间密度$\rho$在量子力学中对应于什么对象？

在经典统计力学中，随时间演化的微观态$\mu_\alpha(t) = \{\vec q_i(t)_\alpha,\vec p_i(t)_\alpha\}$，那么计算系综平均

$\overline{\mathcal O(t)} = \sum_\alpha p_\alpha \mathcal O(\{\vec q_i(t)_\alpha,\vec p_i(t)_\alpha\}) = \int \prod_{i=1}^N {\rm d}^3 \vec p_i {\rm d}^3 \vec q_i \mathcal O(\{\vec q_i,\vec p_i\}) \rho(\{\vec q_i,\vec p_i\},t)$

其中

$\rho(\{\vec q_i,\vec p_i\},t) = \sum_\alpha p_\alpha \prod_{i=1}^N \delta^{(3)}(\vec q_i - \vec q_i(t)_\alpha) \delta^{(3)}(\vec p_i - \vec p_i(t)_\alpha)$

称为系统在相空间中的相空间密度。

类比于此，量子统计力学中，可观测量的期望值的混态平均

$\begin{aligned} \overline{\langle \mathcal O \rangle (t)} &= \sum_\alpha p_a \bra{\psi_\alpha(t)} \hat{\mathcal O} \ket{\psi_\alpha(t)}\\ &= \sum_{\alpha,e,\ell} p_\alpha \braket{\psi_\alpha(t)}{e} \bra{e}\hat{\mathcal O}\ket{\ell} \braket{\ell}{\psi_\alpha(t)}\\ &= \sum_{e,\ell}\bra{\ell}\hat\rho(t)\ket{e} \bra{e}\hat{\mathcal O}\ket{\ell}\\ &= \tr(\hat\rho(t)\hat{\mathcal O}) \end{aligned}$

其中

$\hat\rho(t) = \sum_\alpha \ket{\psi_\alpha(t)}\bra{\psi_\alpha(t)}$

是密度算符；其矩阵元

$\rho_{\ell e}(t) = \bra{\ell}\hat\rho\ket{e} = \sum_\alpha p_\alpha \braket{\ell}{\psi_\alpha(t)} \braket{\psi_\alpha(t)}{e}$

称为密度矩阵。

密度算符的一些性质：

迹归一性：$\tr\hat\rho = \sum_{\ell}\bra{\ell}\hat\rho\ket{\ell} = \sum_\alpha p_\alpha = 1$对任何纯态、混态均成立；密度算符的迹归一性本质上是概率的全局归一性。
平方迹：$\tr \hat\rho^2 \leq 1$，其中等号当且仅当在纯态时成立；混态时取严格小于号。并且，纯态时$\hat\rho^2 = \hat\rho$，混态时不成立。
厄米性：$\hat\rho^\dagger = \hat\rho$，因为$\bra{e}\hat\rho^\dagger\ket{\ell} = \bra{\ell} \hat\rho \ket{e}^* = \sum_\alpha p_\alpha \braket{\psi_\alpha}{\ell}\braket{e}{\psi_\alpha} = \bra{e}\hat\rho\ket{\ell}$，这一性质保证了可观测量期望值的混态平均$\overline {\langle \mathcal O \rangle}$是实数。
正定性：$\bra{\phi}\hat\rho\ket{\phi} = \sum_\alpha p_\alpha \braket{\phi}{\psi_\alpha}\braket{\psi_\alpha}{\phi} = \sum_\alpha p_\alpha |\braket{\phi}{\psi_\alpha}|^2\geq 0$，这表明它的所有本征值都是非负的。

密度矩阵

现在讨论密度矩阵元的物理意义。若在表象$\{\ket{e}\}$中，态矢具有分解形式

$\ket{\psi_\alpha} = \sum_e \braket{e}{\psi_\alpha}\ket{e} = \sum_e c^{(\alpha)}_e \ket{e}$

那么密度矩阵元为

$\rho_{e\ell} = \sum_\alpha p_\alpha c^{(\alpha)}_e c^{(\alpha)*}_\ell$

首先考虑其对角元

$\rho_{ee} = \sum_\alpha p_\alpha c^{(\alpha)}_e c^{(\alpha)*}_e = \sum_\alpha p_\alpha |c_e^{(\alpha)}|^2 = \overline{ |c_e^{(\alpha)}|^2 }$

其中$|c_e^{(\alpha)}|^2$的物理意义是在纯态$|\psi_\alpha\rangle$中测量后得到本征态$|e\rangle$的概率，因此$\rho_{ee}$则表示在该系综测量后得到$|e\rangle$的平均概率，称之为系综在态$|e\rangle$的布居数。显然布居数$\rho_{ee}\geq 0$，当且仅当全体$c_e^{(\alpha)}$都为零时取等号。

而密度矩阵的非对角元

$\rho_{e\ell} = \sum_\alpha p_\alpha c^{(\alpha)}_e c^{(\alpha)*}_\ell = \overline{ c^{(\alpha)}_e c^{(\alpha)*}_\ell }$

出现$c_e^{(\alpha)} c_\ell^{(\alpha){*} }$的交叉乘积项，在量子力学中表明此时系统存在态$|e\rangle$与态$|\ell\rangle$的干涉效应，即在混态系综中有一定概率可能存在两个态的某个线性叠加。而密度矩阵的非对角元$\rho_{e\ell}$则表示这两个态的各种干涉效应在系综中的平均：由于$c_e^{(\alpha)} c_\ell^{(\alpha){*} }$是复数，因而即便所有交叉乘积项都非零，非对角元$\rho_{e\ell}$也可能为零，这意味着各个干涉效应相互抵消了；反之，若非对角元不为零，则说明各个干涉效应不能完全抵消，即$|e\rangle$与$|\ell\rangle$存在一定相干性。因此将$\rho_{e\ell}$称为$|e\rangle$与$|\ell\rangle$的相干元。

时间演化

在经典力学中，相空间密度$\rho$满足刘维尔定理：

$\frac{ {\rm d}\rho}{ {\rm d}t} = \frac{\partial\rho}{\partial t} + \{\rho,\mathcal H\} = 0$

这给出了$\rho$的时间演化：

$\frac{\partial\rho}{\partial t} = \{\mathcal H,\rho\}$

在量子力学中，为得到密度算符的时间演化，可以在能量表象下考察：

$\begin{aligned} {\rm i}\hbar\frac{\partial}{\partial t}\rho_{nm} &= {\rm i}\hbar\frac{\partial}{\partial t}\bra{n}\hat \rho\ket{m}\\ &= {\rm i}\hbar\frac{\partial}{\partial t} \sum_{\alpha}p_\alpha \braket{n}{\psi_\alpha}\braket{\psi_\alpha}{m}\\ &= \sum_\alpha p_\alpha (\mathcal E_n - \mathcal E_m)\braket{n}{\psi_\alpha}\braket{\psi_\alpha}{m}\\ &= \bra{n}(\mathcal H \hat\rho - \hat\rho \mathcal H) \ket{m} \end{aligned}$

于是得到

${\rm i}\hbar\frac{\partial\hat\rho}{\partial t} = [\mathcal H,\hat\rho]$

在下面，如无歧义，将略去算符的$\ \hat{}\ $符号。

量子系综

达平衡态时，宏观态的可观测量期望应当是时间无关的，这无论对经典还是量子都要求$\partial\rho/\partial t = 0$。可以看到，无论对经典还是量子，若取$\rho$是哈密顿量$\mathcal H$的函数（自变量还可以包括与$\mathcal H$对易$[\mathcal H,L_a] = 0$的守恒荷$L_a$），那么自动满足$[\mathcal H,\rho] = 0$，于是也就满足$\partial\rho/\partial t = 0$。在这个意义上将，达平衡时的密度算符$\rho = \rho(\mathcal H)$。据此，就可以类比于经典统计力学，而构造出各种宏观平衡态对应的量子密度算符，也即各种系综的密度。

量子微正则系综

固定宏观能量$E$、广义坐标$X^a$、粒子数$N$的情况，密度算符可写为

$\rho(E) = \frac{\delta(\mathcal H - E)}{\Omega(E)}$

密度算符的迹归一性$\tr\rho = 1$要求量子归一化系数

$\Omega(E) = \sum_n \delta_{E,\mathcal E_n}$

就是哈密顿量算符$\mathcal H$的具有能量本征值$E$的本征态数目。

具体来说，在能量本征态下的密度矩阵元

$\rho_{nm} = \bra{n}\rho\ket{m} = \sum_\alpha p_\alpha \braket{n}{\psi_\alpha}\braket{\psi_\alpha}{m} = \begin{dcases} \frac{1}{\Omega} &{\rm if}\ \mathcal E_n = E\ {\rm and}\ m = n\\ 0 &{\rm if}\ \mathcal E_n \neq E\ {\rm or}\ m \neq n \end{dcases}$

这是等概率假设和随机相位假设的直接结果。

具体来说：混态系综中的任何一个纯态都可以写为这些允许本征态的线性组合：

$\ket{\psi_\alpha} = \sum_\alpha c_n^{(\alpha)} \ket{n} = \sum_\alpha |c_n^{(\alpha)}| {\rm e}^{ {\rm i}\theta_n^{(\alpha)}} \ket{n}$

根据密度矩阵的物理意义我们知道，其对角元$\rho_{nn}$表示混态在相应本征态上的布居数，即测量得到相应本征态的平均概率$\overline{|c_e^{(\alpha)}|^2} = \overline{ |\braket{e}{\psi_\alpha}|^2 }$；而非对角元$\rho_{e\ell}$则表示某两个本征态之间的相干效应：$\overline{ c^{(\alpha)}_e c^{(\alpha)*}_\ell } = \overline{ |c^{(\alpha)}_e| |c^{(\alpha)}_\ell| {\rm e}^{ {\rm i}(\theta_e^{(\alpha)} - \theta_\ell^{(\alpha)})} }$。

等概率假设要求，测量得到不同本征态的平均概率相等，均为：

$\rho_{ee} = \overline{|c_e^{(\alpha)}|^2} = \overline{ |\braket{n}{\psi_\alpha}|^2 } = \frac{1}{\Omega}$

在此基础上，随机相位假设则是说，不同本征态以相位随机的复数构成混态系综中的不同纯态，这些随机相位的平均为零：

$\rho_{ee} = \frac{1}{\Omega} \overline{ {\rm e}^{ {\rm i}(\theta_e^{(\alpha)} - \theta_\ell^{(\alpha)})} } = 0$

量子正则系综

固定宏观温度$T$、广义坐标$X^a$、粒子数$N$的情况，密度算符可写为

$\rho(\beta) = \frac{\exp(-\beta\mathcal H)}{Z(\beta)}$

密度算符的迹归一性$\tr\rho = 1$要求量子正则配分函数

$Z(\beta) = \tr\left( {\rm e}^{-\beta\mathcal H} \right) = \sum_n {\rm e}^{-\beta\mathcal E_n}$

最终的求和是对系统的离散能级求和。

量子巨正则系综

固定宏观温度$T$、广义坐标$X^a$、化学势$\mu$的情况，密度算符可写为

$\rho(\beta,\mu) = \frac{\exp(-\beta\mathcal H + \beta\mu N)}{Q}$

密度算符的迹归一性$\tr\rho = 1$要求量子巨配分函数

$Q(\beta,\mu) = \tr\left( {\rm e}^{-\beta\mathcal H + \beta\mu N} \right) = \sum_{N=0}^\infty {\rm e}^{\beta\mu N} Z_N(\beta)$

注意在此时粒子数$N$不确定，量子系统的态矢所处空间扩展为Fock空间。

例子

考虑由量子正则系综描述的，体积为$V = L^3$的箱中的自由单粒子，哈密顿量算符（坐标表象）

$\mathcal H = -\frac{\hbar^2}{2m}\nabla^2$

其本征态是动量本征态$\ket{\vec k}$，相应的波函数和能量本征值是

$\braket{\vec x}{\vec k} = \frac{1}{\sqrt{V}}{\rm e}^{ {\rm i}\vec k\cdot\vec x}\ ,\qquad \mathcal E_{\vec k} = \frac{\hbar k^2}{2m}$

在周期性边界条件下，允许的动量取值

$\vec k = \frac{2\pi}{L}(n_x,n_y,n_z)$

全体$\ket{\vec k}$构成希尔伯特空间的一组无穷多的完备正交基矢。

在$L\to\infty$极限下，单粒子的量子正则配分函数是

$\begin{aligned} Z_1 &= \tr\rho = \sum_{\vec k}\exp\left( -\frac{\beta\hbar^2 k^2}{2m} \right)\\ &= V\int\frac{ {\rm d}^3k}{(2\pi)^3}\exp\left( -\frac{\beta\hbar^2 k^2}{2m} \right)\\ &= \frac{V}{(2\pi)^3} \left( \frac{2\pi m k_B T}{\hbar^2} \right)^{3/2}\\ &= \frac{V}{\lambda^3} \end{aligned}$

这与经典结果是一致的，只要认为经典$h = 2\pi\hbar$。于是坐标表象下密度矩阵元是

$\begin{aligned} \bra{\vec x'} \rho \ket{x} &= \sum_{\vec k} \braket{\vec x'}{\vec k} \frac{ {\rm e}^{-\beta\mathcal E_{\vec k}}}{Z_1} \braket{\vec k}{\vec x}\\ &= \frac{\lambda^3}{V}V \int \frac{ {\rm d}^3k}{(2\pi)^3} \frac{1}{V} {\rm e}^{ {\rm i}\vec k\cdot(\vec x-\vec x')} \exp\left( -\frac{\beta\hbar^2 k^2}{2m} \right)\\ &= \frac{1}{V}\exp\left[ -\frac{m(\vec x-\vec x')^2}{2\beta\hbar^2} \right]\\ &= \frac{1}{V}\exp\left[ -\frac{\pi(\vec x-\vec x')^2}{\lambda^2} \right] \end{aligned}$

可以看到，密度矩阵的对角元

$\bra{\vec x} \rho \ket{x} = \frac{1}{V}$

就是在箱中一点$\vec x$处找到粒子的概率；

非对角元

$\bra{\vec x'} \rho \ket{x} = \frac{1}{V}\exp\left[ -\frac{\pi(\vec x-\vec x')^2}{\lambda^2} \right]$

则没有经典对应，是完全的量子效应：考虑到粒子在坐标空间实际上是以弥散一定尺度的概率波包形式存在，在有限温度时波包尺度约为$\sim\lambda = \sqrt{2\pi\hbar/mk_BT}$，即热波长。因此中心位置不同的粒子之间也可能存在波包的交叠从而产生干涉效应。

当高温$T\to\infty$时，热波长趋于零，非对角元衰减至零，情况与经典结果一致；当低温$T\to0$时，$\lambda$发散，当波包尺度到达箱尺寸相同的量级，量子效应就会占据主导。